"""
数据计算-filter方法
filter 方法可以对数据源中的每一个元素进行指定规则的过滤
"""
from pyspark import SparkConf, SparkContext
import os
os.environ['PYSPARK_PYTHON'] = "D:/dev/python/python310/python.exe"
conf = SparkConf().setMaster("local[*]").setAppName("filter")
sc = SparkContext(conf=conf)
# 创建 RDD
rdd = sc.parallelize([1, 3, 2, 4, 5, 6])
# filter 方法
# filter 方法可以对数据源中的每一个元素进行指定规则的过滤
rdd2 = rdd.filter(lambda x: x % 2 == 0)
print(rdd2.collect())
sc.stop()
